Combinación de clusterizadores difusos mediante voto posicional para clustering robusto de documentos

نویسندگان

  • Xavier Sevillano
  • Joan Claudi Socoró
  • Francesc Alías
چکیده

The combination of multiple clustering processes provides a means for building robust document clustering systems. This work focuses on the consolidation of fuzzy clusterings, proposing two consensus functions for soft cluster ensembles based on the Borda and Condorcet positional voting strategies. Experiments conducted on two document corpora reveal that the proposed soft consensus functions are capable of yielding consensus partitions of comparable or superior quality to those obtained by state-of-the-art clustering combiners, although their computational complexity is higher due to the ranking process inherent to positional voting techniques.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Sistema de almacenamiento y gestión de documentos para el desarrollo de bibliotecas digitales

El sistema propuesto se ha diseñado para el almacenamiento y gestión de documentos de una biblioteca. La arquitectura del sistema es altamente genérica, con el objetivo de no restringir la clase de documentos gestionables por él. Con ello creamos un sistema base o primario que es independiente del tipo de documento, siendo capaz de almacenar documentos sin atenerse a su formato. El sistema es a...

متن کامل

Clasificación semántica de textos no estructurados mediante un enfoque evolutivo

Resumen. En la actualidad, cerca del 90% de la información se encuentra plasmada tanto en documentos estructurados como no estructurados. Esto ha dado impulso a la investigación e implementación de diferentes algoritmos para el análisis y clasificación de textos de acuerdo a su orientación semántica. Por ello, en el presente trabajo se describe una manera de clasificación de textos no estructur...

متن کامل

Una familia de herramientas para la edición y publicación de noticias basada en NewsML

Resumen. Presentamos en este paper una familia de aplicaciones que pretende facilitar la tarea de crear, diseñar, publicar y almacenar publicaciones periódicas. Por un lado, para la herramienta de creación del periódico, se propone utilizar la tecnología NewsML, basada en el estándar abierto XML, mediante la que representaremos cualquier tipo de información susceptible de ser publicada en un pe...

متن کامل

Análisis del desempeño del algoritmo genético en la clasificación automática de documentos

Resumen. Existen diversos algoritmos de clasificación para el proceso de clasificación automática de documentos, estos algoritmos buscan soluciones eficientes y rápidas, es por lo cual, el Algoritmo Genético es ideal para aplicar a este contexto, ya que es capaz de encontrar soluciones eficientes en unos cuantos segundos, por su capacidad de examinar el espacio de búsqueda en forma amplia y efi...

متن کامل

Resolución de un programa lineal posibilístico mediante programación compromiso

En este trabajo nos planteamos la resolu ci on de un programa lineal con coe cientes imprecisos cuya distribuci on de posibilidad est a de nida por n umeros difusos Para comparar n umeros difusos utilizamos una relaci on de preferencia difusa lo que nos per mitir a hablar de soluciones factibles en grado Cuanto mayor grado de factibilidad exi jamos m as restringido es el conjunto de solu ciones...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 43  شماره 

صفحات  -

تاریخ انتشار 2009